Génération d'images semi-synthétiques de documents anciens
نویسنده
چکیده
This paper presents a software dedicated to semisynthetic old document image generation and its associated ground truth. This work is thus part of the data generation for document processing algorithm performance evaluation. This software allows a user to specify the content and layout of images to generate (fonts, illustrations, line spacing). Several degradation models were incorporated into the software. It is thus possible to generate images containing defects most commonly seen in old books (ink transparency, character degradation). By generating a huge variety of documents, it is possible to assess the robustness of an algorithm according to these degradations. MOTS-CLÉS : modèle de dégradation d’images de documents, génération de vérité terrain, évaluation de performance, bases de données synthétiques.
منابع مشابه
Génération de bases de transactions synthétiques : vers la prise en compte des bordures
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملUtilisation de phénomènes de croissance pour la génération de formes en synthèse d'images
Jury Président
متن کاملUn modèle de bibliothèque numérique collaborative - ARMARIUS
RÉSUMÉ. Les manuscrits anciens numérisés représentent un contenu spécifique pour les bibliothèques numériques. Les utilisateurs travaillant sur ce type de documents ont besoin de systèmes d’assistance et d’espaces de travail collectif pour interpréter, annoter et transcrire ces manuscrits. Dans cet article, nous présenterons un modèle de bibliothèque numérique spécialement conçu pour des manusc...
متن کاملSystème générique et omni-langage de navigation dans des bases de documents anciens basé sur de la recherche de mots par composition intéractive de requêtes
Word retrieval for browsing old digitized document collections is an active field of research. Indeed, because of the bad quality of this type of documents and the use of an ancient language, applying a basic OCR is not enough in general. In order to circumvent these difficulties, we are currently working on a generic, omni-language and interactive word retrieval system for browsing old documen...
متن کاملDétection et Suivi d'Objets dans une Séquence d'Images par Contours Actifs
Dans cet article, nous proposons une méthode de détection et de suivi d’un objet dans une séquence d’images basée sur le contour actif. Une fonctionnelle d’énergies est attachée au contour actif. Après une initialisation du contour actif dans la première image de la séquence, la minimisation des énergies attachées est utilisé afin de détecter le contour. Puis une initialisation automatique du c...
متن کامل